热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

范围内|不同于_.NetCore读取文件时中文乱码问题的解决方法

篇首语:本文由编程笔记#小编为大家整理,主要介绍了.NetCore读取文件时中文乱码问题的解决方法相关的知识,希望对你有一定的参考价值。背景

篇首语:本文由编程笔记#小编为大家整理,主要介绍了.Net Core 读取文件时中文乱码问题的解决方法相关的知识,希望对你有一定的参考价值。


背景


今天在使用core web api上传txt文档的时候本来很顺利的,但是一测试发现读取的中文内容是乱码的,很是纳闷。


出于经验,立马把代码的Encoding.Default改成 Encoding.uft8, 发现还是不行。后面索性把上传的文件另存为下,特地选择带有bom的utf8选项。



但是发现还是乱码。郁闷。


问题


于是在本能的百度下,发现方法一大堆,但是没有一个可以解决问题的。


无意中,发现了链接,找到了官网   如下 


https://docs.microsoft.com/zh-cn/dotnet/api/system.text.encoding.default?view=netcore-3.1#System_Text_Encoding_Default


进去之后,豁然开朗。里面是这么写的,关于Encoding.Default 属性的定义是这样的。


.NET Framework 中的默认属性


在 Windows 桌面上的 .NET Framework 中, Default 属性始终获取系统的活动代码页并创建 Encoding 与其对应的对象。 活动代码页可能是 ANSI 代码页,其中包括 ASCII 字符集以及不同于代码页的其他字符。 由于所有 Default 基于 ANSI 代码页的编码都将丢失数据,因此请考虑 Encoding.UTF8 改用编码。 在 U + 00 到 U + 7F 范围内,UTF-8 通常是相同的,但可以在不丢失的情况下在 ASCII 范围外对字符进行编码。


.NET Core 上的默认属性


在 .NET Core 中, Default 属性始终返回 UTF8Encoding 。 在运行 .NET Core 应用程序的所有操作系统(Windows、Linux 和 macOS)上都支持 UTF-8。


解决办法


So,.NET Framework 中默认编码是GB2312,而在 .NET Core 中不支持,若想使用必须得先注册编码


代码如下


var completeFilePath = Path.Combine(filePath, saveName);
var stream = formFile.OpenReadStream();
Encoding.RegisterProvider(CodePagesEncodingProvider.Instance);
Encoding encoding = Encoding.GetEncoding("gb2312");
using var reader = new StreamReader(stream, encoding);
var input = reader.ReadToEnd();

到此,问题解决。


推荐阅读
author-avatar
念念不忘的叶子公寓
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有